82 research outputs found

    Simple but Not Simplistic: Reducing the Complexity of Machine Learning Methods

    Get PDF
    Programa Oficial de Doutoramento en Computación . 5009V01[Resumo] A chegada do Big Data e a explosión do Internet das cousas supuxeron un gran reto para os investigadores en Aprendizaxe Automática, facendo que o proceso de aprendizaxe sexa mesmo roáis complexo. No mundo real, os problemas da aprendizaxe automática xeralmente teñen complexidades inherentes, como poden ser as características intrínsecas dos datos, o gran número de mostras, a alta dimensión dos datos de entrada, os cambios na distribución entre o conxunto de adestramento e test, etc. Todos estes aspectos son importantes, e requiren novoS modelos que poi dan facer fronte a estas situacións. Nesta tese, abordáronse todos estes problemas, tratando de simplificar o proceso de aprendizaxe automática no escenario actual. En primeiro lugar, realízase unha análise de complexidade para observar como inflúe esta na tarefa de clasificación, e se é posible que a aplicación dun proceso previo de selección de características reduza esta complexidade. Logo, abórdase o proceso de simplificación da fase de aprendizaxe automática mediante a filosofía divide e vencerás, usando un enfoque distribuído. Seguidamente, aplicamos esa mesma filosofía sobre o proceso de selección de características. Finalmente, optamos por un enfoque diferente seguindo a filosofía do Edge Computing, a cal permite que os datos producidos polos dispositivos do Internet das cousas se procesen máis preto de onde se crearon. Os enfoques propostos demostraron a súa capacidade para reducir a complexidade dos métodos de aprendizaxe automática tradicionais e, polo tanto, espérase que a contribución desta tese abra as portas ao desenvolvemento de novos métodos de aprendizaxe máquina máis simples, máis robustos, e máis eficientes computacionalmente.[Resumen] La llegada del Big Data y la explosión del Internet de las cosas han supuesto un gran reto para los investigadores en Aprendizaje Automático, haciendo que el proceso de aprendizaje sea incluso más complejo. En el mundo real, los problemas de aprendizaje automático generalmente tienen complejidades inherentes) como pueden ser las características intrínsecas de los datos, el gran número de muestras, la alta dimensión de los datos de entrada, los cambios en la distribución entre el conjunto de entrenamiento y test, etc. Todos estos aspectos son importantes, y requieren nuevos modelos que puedan hacer frente a estas situaciones. En esta tesis, se han abordado todos estos problemas, tratando de simplificar el proceso de aprendizaje automático en el escenario actual. En primer lugar, se realiza un análisis de complejidad para observar cómo influye ésta en la tarea de clasificación1 y si es posible que la aplicación de un proceso previo de selección de características reduzca esta complejidad. Luego, se aborda el proceso de simplificación de la fase de aprendizaje automático mediante la filosofía divide y vencerás, usando un enfoque distribuido. A continuación, aplicamos esa misma filosofía sobre el proceso de selección de características. Finalmente, optamos por un enfoque diferente siguiendo la filosofía del Edge Computing, la cual permite que los datos producidos por los dispositivos del Internet de las cosas se procesen más cerca de donde se crearon. Los enfoques propuestos han demostrado su capacidad para reducir la complejidad de los métodos de aprendizaje automático tnidicionales y, por lo tanto, se espera que la contribución de esta tesis abra las puertas al desarrollo de nuevos métodos de aprendizaje máquina más simples, más robustos, y más eficientes computacionalmente.[Abstract] The advent of Big Data and the explosion of the Internet of Things, has brought unprecedented challenges to Machine Learning researchers, making the learning task more complexo Real-world machine learning problems usually have inherent complexities, such as the intrinsic characteristics of the data, large number of instauces, high input dimensionality, dataset shift, etc. AH these aspects matter, and can fOI new models that can confront these situations. Thus, in this thesis, we have addressed aH these issues) simplifying the machine learning process in the current scenario. First, we carry out a complexity analysis to see how it inftuences the classification models, and if it is possible that feature selection might result in a deerease of that eomplexity. Then, we address the proeess of simplifying learning with the divide-and-conquer philosophy of the distributed approaeh. Later, we aim to reduce the complexity of the feature seleetion preprocessing through the same philosophy. FinallYl we opt for a different approaeh following the eurrent philosophy Edge eomputing, whieh allows the data produeed by Internet of Things deviees to be proeessed closer to where they were ereated. The proposed approaehes have demonstrated their eapability to reduce the complexity of traditional maehine learning algorithms, and thus it is expeeted that the eontribution of this thesis will open the doors to the development of new maehine learning methods that are simpler, more robust, and more eomputationally efficient

    Imagining thre future in a difficult present: storylines from spanish youth

    Get PDF
    This book investigates and explores the complex dynamics of youth in contemporary society, especially in troubled and crisis-ridden contexts. On the one hand, teenagers and young adults experience social suffering, marginalisation, gender and ethnic bias, and an increased risk to be radicalised and involved in extremism and related violence. On the other hand, it is shown that young people are resilient, and they have a remarkable ability to adapt and cope with extremely difficult situations.2017-1

    Reduced precision discretization based on information theory

    Get PDF
    [Abstract]:In recent years, new technological areas have emerged and proliferated, such as the Internet of Things or embedded systems in drones, which are usually characterized by making use of devices with strict requirements of weight, size, cost and power consumption. As a consequence, there has been a growing interest in the implementation of machine learning algorithms with reduced precision that can be embedded in these constrained devices. These algorithms cover not only learning, but they can also be applied to other stages such as feature selection or data discretization. In this work we study the behavior of the Minimum Description Length Principle (MDLP) discretizer, proposed by Fayyad and Irani, when reduced precision is used, and how much it affects to a typical machine learning pipeline. Experimental results show that the use of fixed-point format is sufficient to achieve performances similar to those obtained when using double-precision format, which opens the door to the use of reduced-precision discretizers in embedded systems, minimizing energy consumption and carbon emissions.Ministerio de Ciencia e Innovación; PID2019-109238GB-C2Xunta de Galicia; ED431C 2018/34Secretaría Xeral de Universidades; ED431G 2019/01Fundación BBVA; Ayudas a Equipos de Investigación Científica 201

    How Important Is Data Quality? Best Classifiers vs Best Features

    Get PDF
    Financiado para publicación en acceso aberto: Universidade da Coruña/CISUG[Abstract] The task of choosing the appropriate classifier for a given scenario is not an easy-to-solve question. First, there is an increasingly high number of algorithms available belonging to different families. And also there is a lack of methodologies that can help on recommending in advance a given family of algorithms for a certain type of datasets. Besides, most of these classification algorithms exhibit a degradation in the performance when faced with datasets containing irrelevant and/or redundant features. In this work we analyze the impact of feature selection in classification over several synthetic and real datasets. The experimental results obtained show that the significance of selecting a classifier decreases after applying an appropriate preprocessing step and, not only this alleviates the choice, but it also improves the results in almost all the datasets tested.This work has been supported by the National Plan for Scientific and Technical Research and Innovation of the Spanish Government (Grant PID2019-109238 GB-C2), and by the Xunta de Galicia (Grant ED431C 2018/34) with the European Union ERDF funds. CITIC, as Research Center accredited by Galician University System, is funded by “Consellería de Cultura, Educación e Universidades from Xunta de Galicia”, supported in an 80% through ERDF Funds, ERDF Operational Programme Galicia 2014–2020, and the remaining 20% by “Secretaría Xeral de Universidades” (Grant ED431G 2019/01). Funding for open access charge: Universidade da Coruña/CISUGXunta de Galicia; ED431C 2018/34Xunta de Galicia; ED431G 2019/0

    Low-Precision Feature Selection on Microarray Data: An Information Theoretic Approach

    Get PDF
    Financiado para publicación en acceso aberto: Universidade da Coruña/CISUG[Abstract] The number of interconnected devices, such as personal wearables, cars, and smart-homes, surrounding us every day has recently increased. The Internet of Things devices monitor many processes, and have the capacity of using machine learning models for pattern recognition, and even making decisions, with the added advantage of diminishing network congestion by allowing computations near to the data sources. The main restriction is the low computation capacity of these devices. Thus, machine learning algorithms capable of maintaining accuracy while using mechanisms that exploit certain characteristics, such as low-precision versions, are needed. In this paper, low-precision mutual information-based feature selection algorithms are employed over DNA microarray datasets, showing that 16-bit and some times even 8-bit representations of these algorithms can be used without significant variations in the final classification results achieved.This work has been supported by the grant Machine Learning on the Edge - Ayudas Fundación BBVA a Equipos de Investigación Científica 2019. It has also been possible thanks to the support received by the National Plan for Scientific and Technical Research and Innovation of the Spanish Government (Grant PID2019-109238GB-C2), and by the Xunta de Galicia (Grant ED431C 2018/34) with the European Union ERDF funds. CITIC, as Research Center accredited by Galician University System, is funded by “Consellería de Cultura, Educación e Universidades from Xunta de Galicia”, supported in an 80% through ERDF Funds, ERDF Operational Programme Galicia 2014-2020, and the remaining 20% by “Secretaría Xeral de Universidades” (Grant ED431G 2019/01). Open Access funding provided thanks to the CRUE-CSIC agreement with Springer NatureXunta de Galicia; ED431C 2018/34Xunta de Galicia; ED431G 2019/0

    Encontrar la cultura: estrategias de indagación para el análisis sociopolítico

    Get PDF
    El objetivo de este artículo es profundizar en los modos de investigar la cultura y el discurso público. Para lograrlo, la primera parte del texto está dedicada a situar los discursos y prácticas en el seno de una concepción amplia de cultura. Se trata de una concepción que, más allá del giro cultural, se centra en la cultura en acción, así como en el diálogo dinámico entre la estructura y la acción. Con el fin de avanzar en una propuesta metodológica, se analizan cuatro trabajos que proponen estrategias diferenciadas para hacer operativo el concepto de cultura.This paper is intended to explore modes of inquiry into culture and public discourse. To this end, the first part of the paper is devoted to situating discourses and practices within a broad notion of culture, a notion which goes beyond the cultural turn and focuses on culture in action, as well as on the dynamic dialogue between structure and action. In order to advance in a methodological proposal, the paper examines four different studies that propose differentiated strategies for making the concept of culture operational.O objetivo deste artigo é aprofundar nos modos de pesquisar a cultura e o discurso público. Para atingi-lo, a primeira parte do texto está dedicada a situar os discursos e práticas no seio de uma concepção ampla de cultura. Trata-se de uma concepção que, mais além do giro cultural, se centra na cultura em ação, bem como no diálogo dinâmico entre a estrutura e a ação. A fim de avançar numa proposta metodológica, analisam-se quatro trabalhos que propõem estratégias diferenciadas para fazer operativo o conceito de cultura

    Assessment of Rights-Related Personal Outcomes in Young People with Intellectual Disability and Autism Spectrum Disorder

    Get PDF
    Despite the great importance of the quality of life concept in the intellectual disability (ID) field, literature about its application to youth with autism spectrum disorder (ASD) is scarce, especially for the rights domain, an area that has become particularly important after the ratification of the Convention on the Rights of Persons with Disabilities. This study focuses on assessing the rights of youth with ASD and ID and comparing their results obtained by people with ID and other associated conditions: Down syndrome and cerebral palsy. The Rights subscale from the field-test version of the KidsLife Scale was administered in a sample composed of 153 participants with ID aged from 4 to 21 years old (ASD = 51; Down syndrome = 51; cerebral palsy = 51). The variables gender, type of schooling, level of ID and level of support needs were significant for the group with ASD. The three groups showed positive outcomes, though youth with Down syndrome obtained statistically significant higher scores than participants with ASD.Aun teniendo gran relevancia el concepto de calidad de vida en el ámbito de la discapacidad intelectual (DI), existe escasa investigación acerca de su aplicación en jóvenes con trastorno del espectro del autismo (TEA), especialmente acerca de la dimensión derechos, área que ha cobrado especial importancia en los últimos años con la ratificación de la Convención de los Derechos de las Personas con Discapacidad de Naciones Unidas. Este estudio se centra en la evaluación de derechos en jóvenes con TEA y DI, comparando sus resultados con dos grupos de jóvenes que presentan DI y otra condición comórbida: síndrome de Down y parálisis cerebral. Para ello, se utilizó la subescala derechos de la versión piloto de la Escala KidsLife en una muestra de 153 participantes con DI entre 4 y 21 años (TEA = 51; síndrome de Down = 51; parálisis cerebral = 51). En el grupo con TEA, el género, el tipo de escolarización, el nivel de DI y de necesidades de apoyo dieron lugar a diferencias significativas. Los tres grupos obtuvieron resultados positivos, aunque los jóvenes con síndrome de Down obtienen resultados significativamente superiores a los obtenidos por jóvenes con TEA

    Los docentes que no han dejado de ser alumnos. Retos y experiencias en dos medios diferentes: online vs presencial

    Get PDF
    En este trabajo presentamos cómo ha sido nuestra primera experiencia docente en dos marcos distintos: por un lado en una asignatura presencial del Grado de Informática de la Universidade da Coruña y por el otro en una asignatura online en el Máster Universitario en Investigación en Inteligencia Artificial de la Universidad Internacional Menéndez Pelayo. La experiencia de impartir simultáneamente ambas asignaturas nos ha permitido conocer las diferencias entre estos dos tipos de enseñanza. Nuestra intención es poner de manifiesto cómo hemos solventado los retos que nos plantearon las dos asignaturas, a fin de que el lector pueda servirse de nuestras breves pero intensas peripecias docentes.In this work, we describe our first teaching experience in two different areas: a face-to-face subject in the Computer Science Degree of the University of A Coruña and an online subject in the Research Master’s Degree in Artificial Intelligence of the Menéndez Pelayo International University. The experience of teaching both subjects simultaneously has allowed us to know the differences between both areas. We want to show how we solved the challenges posed by these two subjects with the aim that the reader can use our brief but intense teaching adventures

    Transitar a la intemperie: jóvenes en busca de integración

    Get PDF
    Depto. de Sociología AplicadaFac. de Ciencias Políticas y SociologíaTRUEpu
    corecore